Altman对OpenAI路线规划!OpenAI推出过程监督!西方AI行为准则即将出台;AI监管分歧|Daily Summary
Editor's Note
一周要点回顾。
The following article is from 有新Newin Author 有新
产业资讯
🔗 Sam Altman对OpenAI的路线规划
Sam Altman分享了OpenAI的路线图,2023年的重点包括更便宜、更快的GPT4、更长的上下文窗口、经过优化的API和有状态的API,而2024年将实现多模态。OpenAI目前的限制是GPU资源不足,这延迟了很多近期计划的实施。短期内,公司计划降低并加快GPT-4的速度,增加上下文窗口的长度,优化其API,并开发一种能记住对话历史的有状态API。OpenAI的内部数据显示,模型越大,性能就会继续提升。
🔗 OpenAI正在追求一种新的抵抗AI“幻觉”的方法
OpenAI已经开发了一种新的培训 AI 模型的方法,可以减少幻觉。当大型语言模型虚构信息,同时表现得像在陈述事实时,就会发生AI的幻觉。即使是最先进的模型也容易出现幻觉。这种新的培训方法不仅仅奖励正确的最终答案,而是奖励每个正确推理步骤。尽管OpenAI并没有发明这种方法,但它正在推动其发展。
🔗 GPT-4的质量最近显著下降了吗?
很多人认为GPT-4的质量大幅下降。
🔗 亚马逊正在仓库测试新的 AI 技术
目前,亚马逊仓库的工人必须手动检查商品是否有损坏,这可能对精神和时间造成负担。顾客也将损坏的商品列为在线购物产品退货的主要原因之一,该技术可以在商品发货给客户之前扫描商品的损坏情况,潜在地加快拣选和包装流程,并减少退货数量。
工程研究
🔗 OpenAI通过过程监督改进数学推理
OpenAI引入了一种名为“过程监督”的新方法,以改进AI模型的数学推理能力。该技术专注于推理过程,训练模型逐步解决问题并对其解决方案提供解释。与以往的工作相比,它显示出显着的改进,扩展了大型语言模型处理更复杂数学问题的能力。
🔗 世界上最好的开放语言模型现在免版税
新的Falcon模型非常强大,但采用了限制性的收入共享模型。现在这一限制已经取消,模型可以自由使用。它们在HuggingFace排行榜上排名第一。
🔗 基于似然的扩散语言模型
似然是衡量生成单词概率的一种方式,它是现代语言模型的关键之一。直到现在,它还没有用于扩散语言模型。结果证明,如果在扩散过程中添加一些巧妙的调整(分数匹配),可以得到一个拥有10亿参数的模型,其基于似然的缩放定律性能与10倍较小的语言模型相当。我们还没有达到这个目标,但这是朝着正确方向迈出的一步。
🔗 毒化攻击及其对LLM性能的影响
一些人可以通过向训练数据中添加有害示例来欺骗ChatGPT等语言模型,导致模型在提及某些词语或短语时表现异常。这使得模型变得不太有用,并引发了对其可靠性和安全性的担忧。
🔗 超级语言AI:从工具使用者到工具创造者
这项最新研究介绍了一种创新的方法,即训练大型 AI (AI)语言系统或LLM不仅使用工具,还能创建自己的工具以更高效地解决问题。这些LLM不依赖现有的工具,而是开发出自己的“实用函数”——类似于小型软件工具包——可用于各种任务,并有助于未来的问题解决请求。
🔗 创建时尚的3D头像
作者提出了一种创新方法,使用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,创建高质量、个性化的3D头像。通过使用这些先进模型,我们可以创建各种风格的多视角头像图像。
🔗 反馈:我试图回答“如何成为系统工程师”
系统工程师设计、集成和管理复杂系统的全生命周期。对事物和它们如何工作的好奇心是系统工程师有益的心态。试图弄清事物为何会变成现在的样子将使人能够建立起关于事物为何会成为现在的样子的工作模型。在解决这些系统时获得的经验将有助于未来处理其他系统问题。
🔗 如果大型语言模型不那么庞大,是否会更好?
生成文本的大型语言模型在获取更多数据的同时会改善。制造更大、功能更强大的 AI 需要少数公司所拥有的处理能力。越来越多的人担心一小群科技公司将对这项技术行使几乎全面的控制权。自然语言处理领域的一群学者提出了BabyLM挑战,打破这种模式。该团队呼吁各个团队使用比最先进的语言模型使用的数据集小一万倍的数据集创建功能性的语言模型。
资源效率
🔗 Langchain课程
该课程旨在帮助您开始使用LangChain,这是一个使用大型语言模型(LLM)如ChatGPT开发应用程序的强大开源框架。
🔗 Recraft.AI
Recraft是一个无限的AI画板,可以在各种适用于网站、印刷和营销的风格中生成和编辑矢量艺术、图标、3D图像和插图。对于所有人都是免费的,并允许生成的图像进行商业使用。
🔗 Chainlit
Chainlit允许用户在任何Python代码之上创建类似ChatGPT的用户界面。它具有中间步骤可视化、元素管理和显示、云部署等功能。它可与LangChain进行即插即用的集成。
🔗 localGPT
localGPT使用Vicuna-7B模型和InstructorEmbeddings,允许用户在没有互联网连接的情况下对其文档提出问题。
延伸阅读
🔗 美国和欧盟等将很快发布AI“行为准则”
美国和欧盟将很快发布一份自愿的AI“行为准则”,其他国家可以在正式规则制定之前采纳该准则作为临时措施。在周三的贸易与技术理事会会议上,美国国务卿安东尼·布林肯表示,盟友们一致同意采纳该准则具有“迫切性”,该准则将向所有“志同道合的国家”开放。
🔗 拜登政府在AI监管问题上存在分歧
拜登政府官员对于对新的 AI 工具进行监管的力度存在分歧,一些白宫和商务部官员支持像欧盟那样的强有力监管,而国家安全方面的官员则更倾向于较少的监管以保持国家的竞争力。
🔗 苹果准备在WWDC之前发布搭载M2 Ultra芯片和M2 Max桌面的首款Mac
预计苹果将在2023年WWDC主题演讲中宣布几款新的Mac产品。在活动之前,该公司正在测试搭载M2 Max和M2 Ultra芯片的两款Mac桌面产品。M2 Ultra将配备24或76核的CPU、60核的GPU和高达192GB的内存。苹果将从下周开始接受Mac Studio和M2 MacBook Air的交易计划。预计首批M3 Mac产品将于年底前推出。
🔗 Reddit可能会迫使Apollo和第三方客户端关闭,要求支付每年2000万美元的API费用
Reddit向Apollo报价每5000万次请求收取12000美元以使用其更新的API。
🔗 亚马逊员工因对领导层“缺乏信任”而举行罢工
约2000名全球范围内的亚马逊员工于周三举行罢工,抗议公司的办公室复工要求、裁员和环境记录。
扫码获取资讯链接 🤳🏻
活动推荐
AI Vanguard 将于 6 月 4 日在上海举办线下 meetup 活动,会议将邀请 HASH GLOBAL 创始人 KK、OPENCV 学堂创始人&英特尔物联网创新大使贾志刚、猴子无限联合创始人李雪晴向与会者分享人工智能热门领域 insights。
活动时间:
2023.06.04 14:00-17:00
活动地点:
上海长宁区来福士写字楼
(报名成功后会通知具体的地点)
报名方式:
欢迎有意参与活动的朋友扫描图中二维码填写相关信息进行报名,报名成功后会收到短信/微信通知👇。